まるクラ勉強会で「Amazon SageMaker MLFlow でスマートに機械学習モデルの実験を管理する方法」について話しました #まるクラ勉強会
データ事業本部 インテグレーション部 機械学習チームのともぞうです。
2024 年 11 月 13 日 にオンラインで まるクラ勉強会 ONLINE #3 という勉強会がありました。
「Amazon SageMaker MLFlow でスマートに機械学習モデルの実験を管理する方法」というタイトルで登壇しましたので資料を公開します。
登壇した資料
ポイント
① SageMaker MLflowはマネージドサービスなので、セットアップがとても簡単
② SageMaker MLflowはUI上でパラメータやメトリクスを簡単に確認できる
③ SageMaker MLflowはUI上でSageMaker Model Registryへのモデル登録ができる
補足
本資料には、SageMaker MLflowサーバーの構築後、どのようにメトリクスやファイルをSageMaker MLflowサーバーに紐づけられるのかについて紹介できておりません。
-
こちらのAWS公式ブログにJupyter Notebookを用いて、どのようにSageMaker MLflowサーバに実験結果をロギング結果を紐づけるのかについてコードで紹介しておりますので、ご参照ください。
-
また、MLflowのロギング方法については、自身のブログの方でも簡単に紹介しておりますのでご参照ください。
注意点
SageMaker MLflowサーバを利用する際に、Sagemaker Notebookを使ってEDAやモデル構築を行うケースが多いかと思います。
その際に、Sagemaker Notebookは「アイドルシャットダウン設定」機能が用意されているため、消し忘れたとしても自動的に終了させることはできますが、SageMaker MLflowサーバにはその機能は搭載されておりませんので、利用されない際には必ず「停止」することをご注意ください。
最後に
まるクラ勉強会 ONLINE #3の資料についてご共有しました。参考になりましたら幸いです。